1 research outputs found
Methodology for the Corpus-based English-German-Ukrainian Dictionary of Collocations
Traballo Fin de Máster en Lexicografía. Curso 2021-2022[EN]This Master’s thesis recounts the vision of the multilingual collocations dictionary project for the English, German, and Ukrainian languages (“Corpus-based English-German-Ukrainian
Dictionary of Collocations” or EDU-Col) and elaborates on the methodology for compiling
the dictionary and its key dictionary structures. The dictionary will cater to the needs of language learners, translators, text producers (journalists, copywriters), and native speakers.
Tapping into the latest developments in NLP and the capabilities of corpora, the methodology
for creating the proposed dictionary relies on the automatic extraction of dictionary information types, namely collocation candidates, example sentences, and translation
equivalents for collocations. The automatic extraction is followed by manual validation in
order to maintain the quality of the obtained lexicographic data.[DE]Diese Masterarbeit befasst sich mit der Konzeption des mehrsprachigen
Kollokationswörterbuchs für die englische, deutsche und ukrainische Sprache ("Corpus-based
English-German-Ukrainian Dictionary of Collocations" oder EDU-Col) und erläutert die
Methodik für die Erstellung des Wörterbuchs und seine wichtigsten Wörterbuchstrukturen.
Das Wörterbuch ist auf die Bedürfnisse von Sprachlernern, Übersetzern, Redakteuren
(Journalisten, Werbetextern) und Muttersprachler ausgerichtet. Die Methodik zur Erstellung
des vorgeschlagenen Wörterbuchs basiert auf der automatischen Extraktion von
Wörterbuchinformationen, nämlich Kollokationskandidaten, Beispielsätzen und
Übersetzungsäquivalenten für Kollokationen. Auf die automatische Extraktion folgt eine
manuelle Überprüfung, um die Qualität der erhaltenen lexikografischen Daten zu
gewährleiste